Méthode semi-compositionnelle pour l'extraction de synonymes des termes complexes

نویسندگان

  • Amir Hazem
  • Béatrice Daille
چکیده

Automatic synonyms and semantically related word extraction is a challenging task, useful in many NLP applications such as question answering, search query expansion, text summarization, etc. While different studies addressed the task of word synonym extraction, only a few investigations tackled the problem of acquiring synonyms of multi-word terms (MWT) from specialized corpora. To extract pairs of synonyms of multi-word terms, we propose in this paper an unsupervised semi-compositional method that makes use of distributional semantics and exploit the compositional property shared by most MWT. We show that our method outperforms significantly the state-of-the-art. MOTS-CLÉS : synonymes, termes complexes, compositionnalité, sémantique distributionnelle, méthode non supervisée.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction bilingue de termes médicaux dans un corpus parallèle anglais/français

Résumé. Le Catalogue et Index des Sites Médicaux Francophones (CISMeF) recense les principales ressources institutionnelles de santé en français. La description de ces ressources, puis leur accès par les utilisateurs, se fait grâce à la terminologie CISMeF, fondée sur le thésaurus américain Medical Subject Headings (MeSH). La version française du MeSH comprend tous les descripteurs MeSH, mais d...

متن کامل

Term Extraction for Ladin: An Example-based Approach

Cette communication traite le problème de l’extraction de termes pour les langues minoritaires. Nous présentons une méthode basée sur des exemples qui fonctionne même si les ressources linguistiques digitales sont rares. Notre méthode se base sur modèles de termes générés à partir d’un nombre limité de termes d’exemple. Les résultats obtenus pour le Ladin du Val Gherdena sont meilleurs que ceux...

متن کامل

L'analyse formelle de concepts pour l'extraction de connaissances dans les données d'expression de gènes

Résumé. L’analyse formelle de concepts (AFC, Ganter et Wille (1999)) est une méthode pertinente d’extraction de connaissances à partir de données complexes d’expression de gènes (Blachon et al. (2007), Motameny et al. (2008)). Dans ce papier, nous proposons d’extraire des groupes de gènes partageant un comportement similaire montrant des changements “significatifs” à travers divers environnemen...

متن کامل

Inferring land use dynamics by semi-Markov model

We propose land use dynamics models corresponding to parcels located on the edge of the forest corridor, Madagascar. We use semi-Markov chain to infer the land-use dynamics. In addition to the empirical and maximum likelihood methods, we estimate the semi-Markov kernel by a Bayesian approach. In the latter case, we use Jeffreys’ non-informative prior and we approximate the posterior distributio...

متن کامل

TopicRank : ordonnancement de sujets pour l'extraction automatique de termes-clés

Keyphrases are single or multi-word expressions that represent the main content of a document. As keyphrases are useful in many applications such as document indexing or text summarization, and also because the vast amount of data available nowadays cannot be manually annotated, the task of automatically extracting keyphrases has attracted considerable attention. In this article we present Topi...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 56  شماره 

صفحات  -

تاریخ انتشار 2015